|
Zpracování řeči
Sborník Workshopu o zpracování řeči je periodická publikace obsahující příspěvky přednesených na workshopech organizovaných každoročně v září v Praze. Letošní sborník obsahuje 30 příspěvků od 55 autorů. Příspěvky jsou věnovány fonetice a prosodii, konstrukci dialogů, analýze, syntéze a zvýrazňování řeči, rozpoznávání mluvčího a řeči a konversi hlasu.
|
| |
| |
|
Algoritmy potlačení šumu v řeči zkreslené telekomunikační sítí
Koula, Ivan ; Esposito, A.
Příspěvek porovnává efektivitu tří odlišných algoritmů zvýraznění řeči. Hodnocení efektivity je založeno na určení procentuelní úspěšnosti rozpoznání zpracované řeči pomocí řečového rozpoznávače. Všechny popsané algoritmy jsou založeny na metodě spektrální subtrakce, ale liší se rozdílným způsobem odhadu výkonového spektra šumu. První algoritmus provádí odhad statistickou analýzou spektrálních vlastností signálu obsaženého v řečových pauzách. Zbylé dva algoritmy odhadují výkonové spektrum šumu pomocí nelineárních adaptivních modelů.
|
| |
|
Možnosti modelování prozodie TTS systému Epos s použitím MBROLA rozhraní
Horák, Petr ; Chaloupka, Zdeněk
Příspěvek se zabývá možnostmi modelování prosodie v TTS systému EPOS. Cílem je vytvořit TTS systém, který je schopný modelovat trvání jednotlivých hlásek a tím dosáhnout snadného využití MBROLA kompatibilních českých hlasů. Epos je jazykově nezávislý systém pro převod textu do řeči (Text-To-Speech). Může být konfigurován v širokých mezích bez nutnosti nové kompilace. Využitím editovatelných pravidel pro každý krok syntézy nabízí Epos možnost sledování celého procesu a snadný postup při aplikaci změn.
|
| |
|
Použití RLPC inventářů systému Festival v Eposu
Chaloupka, Zdeněk ; Horák, Petr
Cílem tohoto příspěvku je popsat možnosti implementace nových hlasů do text-to-speech (TTS) systému Epos. Pro implementaci jsme použili inventáře TTS systému Festival. Inventáře obsahují komprimované řečové jednotky v podobě koeficientů Residuálně Lineárního Predikčního Kódování (RLPC) a další nutné informace pro syntézu řeči. Text je předáván systému Epos v MBROLA formátu a je tedy možné přímo určovat délku hlásek i tvar prosodie.
|